1
Statistik sebagai Variabel Acak: Distribusi Sampel
MATH003Lesson 4
00:00
Dalam inferensi statistik, kita beralih dari mengamati titik data individu menuju menganalisis sebuah **statistik**β€”pemetaan fungsional $Y = h(X_1, X_2, \dots, X_n)$ dari urutan sampel. Karena sampel dasar terdiri dari variabel acak, statistik itu sendiri merupakan variabel acak, dan hukum probabilitasnya dikenal sebagai **distribusi sampel**.

Statistik sebagai Pemetaan

Statistik secara formal didefinisikan sebagai fungsi $h: \mathbb{R}^n \to \mathbb{R}$. Kita mendefinisikan probabilitas statistik yang jatuh ke dalam himpunan $B$ menggunakan prapeta:

$$h^{-1} B = \{(x_1, x_2, \dots, x_n) : h(x_1, x_2, \dots, x_n) \in B\}$$

Dasar I.I.D.

Untuk sampel dari variabel acak i.i.d. (independen dan berdistribusi identik), probabilitas gabungan dari suatu titik sampel tertentu $(x_1, \dots, x_n)$ adalah hasil kali dari probabilitas marginal mereka: $p(x_1)p(x_2)\dots p(x_n)$. Produk ini berfungsi sebagai bobot untuk setiap titik saat menghitung probabilitas total bahwa statistik mengambil nilai tertentu.

Contoh 4.1.1: Rata-rata Geometrik

Pertimbangkan populasi diskret di mana $p_X(1) = 1/2$, $p_X(2) = 1/4$, dan $p_X(3) = 1/4$. Kita mengambil sampel berukuran $n=2$ ($X_1, X_2$) dan mendefinisikan statistik kita sebagai rata-rata geometrik: $Y_2 = (X_1 X_2)^{1/2}$.

Untuk mencari distribusi $Y_2$, kita daftarkan semua pasangan $(X_1, X_2)$ yang mungkin sebanyak 9, hitung probabilitas gabungannya, dan nilai $Y_2$ yang dihasilkan:

Pasangan $(x_1, x_2)$Prob $P(x_1)P(x_2)$$Y = \sqrt{x_1 x_2}$
(1, 1)1/41.000
(1, 2), (2, 1)1/8 + 1/8 = 1/41.414
(1, 3), (3, 1)1/8 + 1/8 = 1/41.732
(2, 2)1/162.000
(2, 3), (3, 2)1/16 + 1/16 = 1/82.449
(3, 3)1/163.000

Distribusi Eksak vs. Asimtotik

Sebelum beralih ke teorema batas seperti Teorema Batas Pusat (CLT), kita harus menguasai "Distribusi Eksak." Ini melibatkan perhitungan fungsi massa atau densitas probabilitas spesifik untuk suatu statistik dengan ukuran sampel $n$ yang kecil dan terbatas. Ketika bentuk analitik menjadi tidak dapat ditangani, kita beralih ke simulasi numerik seperti **pendekatan Monte Carlo**.

🎯 Prinsip Utama
Distribusi sampel adalah distribusi dari suatu variabel acak yang berkaitan dengan fungsi dari suatu urutan i.i.d. Hal ini merupakan jembatan antara data mentah dan inferensi ilmiah.